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ВИКОРИСТАННЯ МОДЕЛЕЙ ГЛИБОКОГО НАВЧАННЯ ДЛЯ 
ВИЯВЛЕННЯ ШТУЧНО ЗГЕНЕРОВАНИХ ЗОБРАЖЕНЬ 


Анотація. Використання моделей машинного навчання для класифікації реальних та штучно згенерованих 
зображень стає все більш актуальним напрямком досліджень у сфері штучного інтелекту. Ця стаття присвячена 
аналізу та розробці різноманітних моделей машинного навчання, що застосовуються для цієї задачі. Наша 
основна мета полягає в тому, щоб дослідити ефективність різних архітектур нейронних мереж у класифікації 
зображень, які були створені як людиною, так і за допомогою штучного інтелекту. 

В рамках дослідження ми використовували дев'ять різних архітектур нейронних мереж, розроблених з 
метою аналізу їх ефективності в класифікації зображень. Ми вивчали як реальні зображення, так і ті, що були 
згенеровані за допомогою штучного інтелекту. Останні стають все більш поширеними в сучасному світі, а, отже, 
з'являється необхідність в їх визначенні та класифікації. 

Основні результати нашого дослідження включають детальний аналіз характеристик згенерованих 
зображень, а також порівняння моделей за допомогою різних метрик. Ми використовували такі метрики, як 
точність та Е1-оцінка, що дозволили нам об'єктивно оцінити роботу кожної з моделей. Крім того, ми визначили 
найбільш ефективні моделі для задачі класифікації зображень. 

Одним із ключових висновків нашого дослідження є те, що моделі, які використовують регуляризацію та 
аугментацію даних, показали кращі результати. Регуляризація та аугментація даних допомагають забезпечити 
більш стабільну точність класифікації та зменшують схильність до перенавчання, що є важливою проблемою в 
галузі машинного навчання. 

Ці результати можуть бути корисними для розробки стратегій протидії дезінформації, що стала проблемою 
в сучасному інформаційному суспільстві. Завдяки використанню моделей машинного навчання можна виявляти 
штучно згенеровані зображення та відокремлювати їх від реальних, що допоможе запобігти поширенню 
фальшивих новин та дезінформації. 

Крім того, результати нашого дослідження можуть сприяти подальшому вдосконаленню алгоритмів 
генерації зображень, що є важливим напрямком розвитку штучного інтелекту. Вони можуть слугувати основою 
для створення більш точних та ефективних моделей, які зможуть генерувати зображення, що максимально 
наближені до реальних. 

Ключові слова: машинне навчання, класифікація зображень, штучний інтелект, нейронні мережі, 
регуляризація, аугментація даних, дезінформація, алгоритми генерації зображень, точність, ЕІ-оцінка, 
перенавчання. 
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О5ІХС МАСНІХЕ ІКАВХІХС МОРЕЇ,5 ТО РЕТЕСТ 
АКТІКІСІАІ ЛІ. У СЕХЕКАТЕО ІМАСЕЗ5 


АБбігасі. Те ицз5е ої пласбіпе Іеагпіпе, плодеїз (о сіаз5ібу геа! апа агійїсіаЙу депегакед ітаєез 15 бесотіпеє ап 
іпстеазіпеЇу теіемапі агеа ої ге5еагсі іп Ше Пе! ої агісіа! іпіеШяєепсе. ТРіз рарег 15 дедїсакед (о Ше апаїузіз апа 
деуеїортепі ої уагіоц5 птзасфріпе Іеагпіпє поаеїз ц5еа Гог різ ка5К. Опг таїп 80аі 15 10 іпуе5ібаге Ше ей'еспуепез5 ої 
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ФїНегепі пеита! пеїмогК агсрігесіитез іп сіаз5іїуїпе ітаєез Шаї Бауе Бееп сгеаїед Бої їп Бу питап апа мій Фе Ре!р ої 
агійсіа! іпіеШоепсе. 

Аз рагі ої Ше 5шшау, уе ц5ед піпе ФїНегепі пеигаї пебуотК агспікесіите8 Фезіяпед (о апаїуєе Шеїг ебесійуепез5 іп 
сіа855ібуїпє ітаєез. У е 5шага бо геа! ітаєез апа ШБозе єепегагед Бу агийсіа! іпіеШяепсе. ТПе Іайег аге Бесотіпеє 
паоге апа тоге сопатоп іп Фе плодеги у/огій, уубіср плеап5 ак еге 15 а пееа Рог реїг ідепіійсайоп апа сіав8війсаноп. 

Тре таїп гезиїв ої сиг 5(шау іпсіцде а дегатеа апаїузія ої Бе срагасіегізйїся ої Ше депегатїед ітабез, а8 ме! а8 
а соттрагі5оп ої Ше піодеїз пзіпє уагіоця теїгіся. У/е п5ед теїгіся зисП а5 ассигасу апа Б1-єсоге, мПпіср аПомедй ця 0 
обіесйуєіу еуаїшате Ше регіогтапсе ої еасп тодеі. Га адаїйоп, ме ідепійей Ше позі ебесійуєе поаєеія Їог Фе ітаєе 
сіазвійсайоп та5К. 

Опе ої Бе Кеу Плаїпя58 ої оиг 5їиду 15 Фа піодеі8 Шаг и5е Чаїа геєціагізацоп апа апстепіайоп регіогтеай Бейгег. 
Даїа герміагізайоп апа апетепіайоп Бер (о еп5иге поге 5кабіе сіа55ійсайоп ассигасу апа гедисе Ше Кепдепсу 0 
оуегійипє, урісі 15 ап ітрогіапі і55це їп плзаспіпе Іеагпіпе. 

Тревзе гезиів сап Бе ипвеїиі Гог деуеіоріпе., зітаевіез го соппіегасі дФїзіпРогтайоп, біс баз бесоте ап і55це іп 
Фе тодегп іпіогтайоп 5осіеїу. Ву и5іпє пааспіпе Іеагпіпє плодеї8, агіййсіаПу депегатїед ітаєе5 сап Бе деіесіва апа 
зерагакед топ теа! ітаєе58, місії сап Пер ргеуепі Ше зргеай ої Гаке пем8 апа даїзіпГогтайоп. 

Іо адаїйоп, Фе ге5иів ої оиг гезеагсп сап сопігібше (о Фе ГигФег ігаргоуетепі ої ітаєе єепегайоп аїєогітя, 
мурісП 15 ап ітпрогіапі агеа ої агийсіа! іпіеШяєепсе демеїортегпі. ТПеу сап 5егуе а5 а Ба5і8 Гог сгеайпє поге ассита!е апа 
еййсіепі поадєія Шаг сап сепегаїе ітаєєз їБаг аге аз сіо5е (о геа! Ше аз роз5іБіе. 

Кеууогадз: пасріпе Іеагпіпє, ітаєе сіаз5ійсайоп, агіїйсіа! іпіеШеепсе, пешга! пебмогк5, геєпіагізайоп, даїа 
апетепіайоп, пляіпіогтайоп, ітаєє бепегайоп аїдогійтя, ассигасу, БІ ясоге, геїгаїпіпе. 


Вступ Розробка та вдосконалення методів 
У сучасному світі, де штучний генерації зображень, в свою чергу, можуть 
інтелект (ШІ) все більше впливає на різні відкрити | нові | можливості для їх 
аспекти нашого життя, виникає застосування. Зокрема, більш точні та 
необхідність | в | розробці надійних реалістичні згенеровані зображення 
технологій, які | зможуть відрізнити можуть бути використані в таких сферах, як 
згенеровані ШІ зображення від справжніх створення віртуальної реальності, 
фотографій або малюнків. Ця наукова тренування моделей штучного інтелекту, 
робота є спробою дослідити цю проблему, створення візуалізацій у науці та освіті, 
протестувати з та проаналізувати різні онлайн-реклама та інше. 
методи та алгоритми, що допоможуть у 
створенні ефективної моделі для такої Методи та засоби реалізації 
класифікації. Нейронні мережі - це системи 
Особливий акцент У цьому обчислень, які були розроблені для імітації 
дослідженні робиться на використання способу, яким людський мозок аналізує та 
глибокого навчання та нейронних мереж. обробляє інформацію. Вони складаються з 
Ці методи вже успішно застосовуються в великої кількості взаємопов'язаних 
різних задачах класифікації зображень 1 обчислювальних вузлів, відомих як 
демонструють високу ефективність, тому їх нейрони. Назва "нейронна мережа" 
потенціал || у | контексті | вирішення походить від біологічних нейронів у мозку 
поставленої проблеми варто розглядати людини, які вони намагаються відтворити. 
більш детально. Кожен нейрон в нейронній мережі 
Модель, яка була розроблена в рамках отримує набір вхідних даних, до яких 
цієї роботи, має великий потенціал для застосовуються ваги. Ваги - це числові 
практичного застосування. Зокрема, вона коефіцієнти, які визначають, наскільки 
може стати частиною систем важливий кожен вхід для вихідного 
автентифікації контенту в соціальних сигналу нейрона. Потім до суми вагових 
мережах, де вона допоможе виявляти та входів додається зміщення, яке дозволяє 
видаляти фальшивий контент на основі нейрону регулювати свій вихід. 
згенерованих зображень. Крім того, ця Робота нейронної мережі складається 
модель може бути корисною в наукових з двох основних етапів: прямого 
дослідженнях, де вона допоможе визначати розповсюдження та зворотного 
автентичність зображень або виявляти розповсюдження. Пряме розповсюдження - 
зміни, внесені за допомогою ШІ. це процес, що перетворює вхідні дані в 


вихідний сигнал. Вхідні дані проходять 
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через кожний шар мережі в одному 
напрямку, від вхідного шару до вихідного 
шару, де генерується кінцевий результат. 
Зворотне розповсюдження - це метод, за 
допомогою | якого | мережа вчиться, 
коригуючи свої ваги та зміщення на основі 
помилок у своїх прогнозах. Після генерації 
вихідного сигналу мережа порівнює свій 
прогноз зі справжнім з значенням за 
допомогою функції втрат. 

Згорткові нейронні мережі 
(Сопуошіопа! Меипгаї Хебуогк58, СХ) - це 
клас глибоких нейронних мереж, які були 


спеціально | розроблені | для обробки 
зображень. Вони широко 
використовуються в різноманітних задачах 
комп'ютерного | бачення, таких як 
класифікація зображень, розпізнавання 
об'єктів, семантична сегментація 


зображень тощо. 
Основна особливість СММ полягає в 


тому, що вони використовують згортки 
(сопуо ийопя) замість звичайних 
повноз'єднаних шарів, які 


використовуються в більш традиційних 
глибоких нейронних мережах. Згортки 
дозволяють мережі автоматично та 
адаптивно вчити просторові ієрархії ознак з 
зображень, що забезпечує більш ефективне 
навчання. 


Шари згорткових мереж 


Згортковий | шар  (Сопуоийопа! 
Таует). 
Згортковий | шар є основним 


будівельним блоком СММ. Він сканує 
вхідне зображення за допомогою набору 
ваг, відомих як "ядро згортки" або "фільтр", 
та виконує операцію згортки, що дозволяє 
витягнути просторові ознаки з зображення. 

Основні параметри: 

- НПег5  - кількість фільтрів в 
згортковому шарі. Кожний фільтр вчиться 
видобувати окрему ознаку з вхідних даних. 

- Кегпе| 5і7е - розмір ядра згортки. 
Він визначає розмір вікна, яке "проходить" 
по вхідному зображенню. 

- 5Шіде5 - крок, з яким вікно 
проходить по вхідному зображенню. 

- радаїпе - визначає, чи буде додано 
нулі до країв вектора вхідного зображення, 
щоб зберегти його розмір після згортки. 
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- асйуайоп - функція активації, яка 
застосовується після кожного шару. 
Найчастіше | використовується | Веї )) 
(гесййеа Ппеаг ипідб. 


Агрегувальний шар (Роодіїпє Гауеєт). 

Агрегувальний шар використовується 
для зменшення просторового розміру 
вхідного зображення. Це допомагає 
зменшити кількість параметрів моделі і 
запобігає | перенавчанню. Найчастіше 
використовується максимізаційне 
агрегування, яке вибирає максимальне 
значення з кожного вікна вхідних даних. 

Основні параметри: 

- рооі| 58іге - розмір вікна агрегації. 
Він визначає розмір вікна, яке "проходить" 
по вхідному зображенню. 

- 5шідез - крок, з яким вікно 
проходить по вхідному зображенню. 

- радаїпе - визначає, чи буде додано 
нулі до країв вектора вхідного зображення 
перед виконанням агрегації. 


Повноз'єднаний шар (КиПу Соппесіеа 
Тауег, Репге). 

Повноз'єднаний шар  використо- 
вується в кінці мережі для виконання 
класифікації на основі вивчених ознак. Всі 
вузли в цьому шарі з'єднані з усіма вузлами 
в попередньому шарі. 

Основні параметри: 

- шпіїз - кількість вузлів в шарі. Вона 


відповідає кількості класів у задачі 
класифікації. 
- асйуайоп  - функції активації 


використовуються в нейронних мережах 
для внесення нелінійності в модель. Вони 
визначають вихід кожного нейрона на 
основі його входу. 
В роботі використані 
найпопулярніші функції: 
Сигмоїдна функція (Зі9тоїа): 


такі 


(х) осот 
Ї 1 зе" 


Сигмоїдна функція конвертує 
будь-яке число в діапазон від 0 до 1, що 
робить її корисною для моделей, що 
прогнозують ймовірності. Проте, вона 
може страждати від проблеми "вимирання 


І55М 2710 - 1673 Агбійсіаї ПасеНісепсе 2024 Мо 3 


градієнтів", коли градієнти стають дуже 
маленькими і мережа перестає навчатися. 
Веї Ю (ВесіНеа ІЛпеаг Спії): 


Г(х) - тах(0,х) 


Кеї ЮО дуже проста функція, яка 
повертає 0 для від'ємних чисел і просто 
повертає х для додатних чисел. Кер ) 
популярна через з свою 0 простоту та 
ефективність, але вона може страждати від 
проблеми "мертвого нейрона", коли 
нейрони перестають реагувати на будь-які 
вхідні дані. 

Ргороиі Гауег. 

Огороці - це техніка регуляризації, що 
запобігає перенавчанню. Вона випадково 
вимикає вказану частку нейронів під час 
кожного проходу вперед, що допомагає 
забезпечити, що модель не стане занадто 


залежною від будь-якого окремого 
нейрона. 

Кіапеп Пауег. 

Кайеп шар використовується для 
перетворення багатовимірного вектора 
вхідних даних в одномірний вектор. Це 
зазвичай використовується перед 


повноз'єднаним шаром для підготовки 
даних. 

Після аналізу з- архітектури та 
ефективності моделей, важливими 
компонентами є і інші параметри, які 
можуть впливати на результати моделей. 

Оптимізатори. 

Оптимізатори використовуються для 
оновлення ваг моделі на основі градієнтів, 
обчислених під час зворотного поширення 
помилки. Найпопулярнішим  оптиміза- 
тором є А4ат, який адаптивно налаштовує 
швидкість | навчання | для | кожного 
параметра. 

Функції втрат. 

Функції втрат використовуються для 
обчислення помилки моделі під час 
навчання. Вибір функції втрат залежить від 
специфіки задачі. Для задач класифікації 


найчастіше | використовуються (То55- 
Епітору  10585е5. Цей метод вимірює 
"відстань" між реальними та 


прогнозованими відповідями моделі. 
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Метрики. 

Метрики використовуються для 
оцінки продуктивності моделі під час 
навчання та тестування. Для задач 
класифікації найчастіше використовуються 
точність (ассигасу), повна відповідність 
(гесаП), точність (ргесізіоп) та ЕКІ-оцінка 
(Б1-8соге). 

Кількість епох (еросп). 

Епоха - це один повний прохід по 
всьому набору навчальних даних в процесі 
тренування. Вказівка кількості епох - це 
кількість разів, коли алгоритм пройде через 
весь набір даних. Якщо кількість епох 
занадто | мала, | модель | може бути 
недонавченою, тобто | вона може не 
встигнути | вивчити всі | шаблони в 
навчальних даних. Якщо ж кількість епох 
занадто велика, модель може 
перенавчитися, тобто занадто 
"зафіксуватися" на навчальних даних і 
втратити здатність до узагальнення. 

Розмір пакета (Раїсп 5іге). 

Розмір пакета визначає кількість 
прикладів навчання, які пропускаються 
через мережу перед тим, як оновлюються 
ваги. 

Занадто малі пакети можуть 
призвести до нестабільного навчання та 
поганого узагальнення. Занадто великі 
пакети можуть бути неефективними з точки 
зору використання пам'яті та 
обчислювальних ресурсів. Крім того, вони 
можуть призвести до швидкої збіжності до 
мінімуму, який не є оптимальним (тобто до 
локального мінімуму, а не глобального). 

Аугментація даних - це процес, при 
якому збільшується кількість | даних 
шляхом створення модифікованих версій 
вже існуючих даних. Це допомагає 
покращити | продуктивність моделей 
машинного навчання, оскільки | вони 
отримують більш різноманітні дані для 
навчання. Аугментація зображень також 
дозволяє моделям бути менш чутливими до 
положення, орієнтації, освітлення та інших 
аспектів | зображення, що допомагає 
покращити їхню продуктивність в 
реальному світі. 

Можна виокремити 
аугментації зображень: 


такі методи 
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1. Обертання: зображення можна 
обертати на довільний кут. Це може 
допомогти моделі краще розпізнавати 
об'єкти, які знаходяться під різними 
кутами. 

2. Зсув: зображення можуть бути 
зсунуті вгору, вниз, вліво або вправо. Це 
допомагає моделі краще розпізнавати 
об'єкти, які можуть не знаходитися в центрі 
зображення. 

3. Масштабування: зображення 
можуть бути збільшені або зменшені. Це 
може допомогти моделі краще розпізнавати 
об'єкти різних розмірів. 

4. Віддзеркалення: зображення 
можуть бути віддзеркалені по горизонталі 
або вертикалі. Це може допомогти моделі 
краще розпізнавати об'єкти, орієнтація яких 
може варіюватися. 

5. Зміна | яскравості: | яскравість 
зображення може бути змінена. Це може 


допомогти моделі краще розпізнавати 
об'єкти при різних умовах освітлення. 

6. Шум: в зображення може бути 
внесено деякий шум. Це може допомогти 
моделі стати більш стійкою до випадкового 
або небажаного зміщення у вхідних даних. 

7. Деформація: зображення можуть 
бути деформовані шляхом стиснення або 
розтягування. Це може допомогти моделі 
краще розпізнавати об'єкти, форма яких 
може варіюватися. 


Результати та їх аналіз 

Для даної роботи були зібрані 
зображення з декількох наборів даних з 
платформи Каєзіе загальним обсягом 2794 
зображення, з них 1665 згенеровані. 

На рис. 1 нижче приклад реальних 
фото, малюнків, графіків, а на рис. 2 
приклад згенерованих фото. 


Рис. 2. Приклади згенерованих зображень 


Спочатку | знайдемо | стандартне 
відхилення у кожному класі даних. 


де: 
- хі - кожне окреме значення в наборі 
даних 
- ш- середнє значення набору даних 
- М - кількість значень в наборі даних. 
Згенеровані зображення мають вище 
середнє стандартне відхилення (65.29), ніж 
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реальні зображення (63.01). Це може 
свідчити про те, що згенеровані зображення 
в середньому мають більше варіативності 
або "шуму" порівняно | з реальними 
зображеннями. 

Також знайдемо середні значення 
КСВ. Середні зд значення КСВ для 
згенерованих зображень є нижчими, ніж 
для реальних зображень. Це свідчить про 
те, що  ШіІ-згенеровані зображення в 
середньому є  темнішими або менш 
насиченими, ніж реальні зображення. 

Кореляційна матриця для набору 
даних обчислюється за формулою: 


сотт(Х. У) - ан 2 Ли 29) 

(М -- 1)суву 
де: 

- Х, У - це два виміри (або два ряди) в 
даних. 

- хі у - це окремі значення в рядах Х і 
У відповідно. 

- Шо» шу - це середні значення рядів Х 1 У 
відповідно. 

- ох бу - це стандартні відхилення рядів 
Х 1 У відповідно. 

- М - це кількість значень в кожному 


ряду. 


ЖИ , 8.90133621, 89.77827218) 


|0.90133621, 1. 


, 8.89511924) 


|0.77827218, 0.89511924, 1. ) 


Рис. 3. Матриця кореляції для реальних зображень 


в це , 8.86893171, 0.71378172| 


Г/9.86893171, 1. 


, 8.85859611) 


|0.71378172, 0.85859611, 1. ) 


Рис. 4. Матриця кореляцій для згенерованих зображень 


Матриці кореляції (рис. 3 та рис. 4) 
для обох типів зображень показують високу 
позитивну кореляцію між каналами ВСВ. 
Проте, кореляція між каналами є вищою 
для реальних зображень, особливо між 
каналами Б та В. Це може свідчити про те, 
що колірні складові | в | реальних 
зображеннях є більш тісно пов'язаними, ніж 
в згенерованих зображеннях. 

Перед поданням даних в модель 
потрібно стандартизувати розмір 
зображення та нормалізувати їх. 

Зменшимо розмір усіх зображень до 
64х64, що дозволить швидко 
опрацьовувати їх та зменшить шуми. 


Нормалізуємо зображення. Поділимо 
значення пікселів на | 255, що є 
максимальним | можливим значенням 
пікселя | в  8-бітному зображенні та 
перетворює значення пікселів до діапазону 
від 0 до І. 

Об'єднаємо зображення в один набір 
даних та їх класи в інший. Розділимо 
зображення на набір для тренування та 
тестування | моделей за | принципом 
8090/2090. 

Для оцінювання | і порівняння 
ефективності моделей  використовува- 
тимемо такі метрики як точність (ассигасу) 
та Е1-оцінка. 


Точність - (ТР - ТМ)/(ТР-- ТУ - ЕР -- КУ) 


де: 

- ТР - це кількість Ттие Робійуєе8 
(справжні позитивні), тобто кількість 
позитивних випадків, які правильно 
класифіковані як позитивні. 


- ТМ - це кількість Тгие Мерайуез 
(справжні негативні), тобто кількість 
негативних випадків, які правильно 
класифіковані як негативні. 
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- ЕР - це кількість Каізе Розішуе5 
(хибні позитивні), тобто кількість 
негативних випадків, які помилково 
класифіковані як позитивні. 


- ЕМ - це кількість Каї5е Месайуе8 
(хибні негативні), тобто кількість 
позитивних випадків, які помилково 
класифіковані як негативні. 


КІ - 2 Х (Точність ї Повнота) / (Точність -- Повнота) 


де: 
- Точність - ТР / (ТР ч ЕР) 
-- Повнота - ТР / (ТР - ЕМ) 


Е1-оцінка враховує як точність, так і 
повноту, і є корисною метрикою для 
незбалансованих класів, оскільки вона 
штрафує моделі, які виконують погано в 
одному або обох цих аспектах. 

У цьому дослідженні ми створили 9 
моделей машинного навчання з різною 
архітектурою шарів, кожна з яких була 
навчена | протягом  30-ти | епох з 
використанням оптимізатора АдЧат. 

- Модель 1: ця модель складається Із 
згорткового шару, шару максимального 
згруповування, шару розгортки та 
повноз'єднаного шару. Згортковий шар має 
32 фільтри розміром 3х3 1 загалом 896 
параметрів, що допомагає виявляти різні 
особливості зображення. Шар 
максимального  згруповування зменшує 
розмір - вихідних даних вдвічі, що 
прискорює обчислення. Заключний 
повноз'єднаний шар з одним виходом має 
30,753 параметри, що дозволяє моделі 
робити прогнози. 

- Модель 2: ця модель має два 
згорткові шари та два шари максимального 
згруповування. Другий згортковий шар має 
64 фільтри розміром 3х3 і містить 18,496 
параметрів. Це дозволяє моделі виявляти 
більш складні особливості зображення. 

- Модель 3: ця згорткова модель з 
трьома згортковими шарами та одним 
повноз'єднаним шаром. Третій згортковий 
шар має 128 фільтрів, що дозволяє моделі 
виявляти ще більш детальні особливості 
зображення. 

- Модель 4: ця модель має один 
згортковий шар, один шар регуляризації та 
один повноз'єднаний шар. Шар 
регуляризації допомагає запобігти 
перенавчанню моделі. 
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- Модель 5: складається з одного 


згорткового шару, одного шару 
нормалізації та одного повноз'єднаного 
шару. Шар нормалізації | допомагає 


прискорити навчання моделі та зробити 
його більш стабільним. 

- Модель б: має два згорткові шари, 
один шар  регуляризації, один шар 
нормалізації та один повноз'єднаний шар. 
Комбінація регуляризації та нормалізації 
допомагає моделі навчитися ефективніше 
та запобігти перенавчанню. 

- Модель 7: складається з одного 
згорткового шару та одного 
повноз'єднаного шару з більшою кількістю 
нейронів. Збільшення кількості нейронів 
допомагає моделі виявляти більше 
шаблонів у даних. 

- Модель 8: використовує аугмен- 
тацію даних та має просту архітектуру. 
Аугментація даних допомагає моделі краще 
досягти узагальнення, створюючи 
додаткові варіації даних для навчання. 

- Модель 9: має вдвічі більшу 
кількість пакетів та просту архітектуру. 
Збільшення кількості пакетів допомагає 
моделі краще навчитися на даних. 

Кожна модель оцінена за її точністю, 
швидкістю навчання та здатністю уникнути 
перенавчання. Результати показали, що 
моделі з регуляризацією та аугментацією 
даних виявилися найефективнішими. Для 
кращого розуміння ефективності кожної 
моделі створено порівняльну таблицю І, де 
представлені основні характеристики та 
результати кожної моделі. В таблиці можна 
побачити ключові метрики ефективності, 
такі як точність та КІ 5соге. 

На рис. 5 представлено точність для 
навчального та тестового наборів даних для 
кожної з моделей. 

Цей графік дозволяє нам візуально 
порівняти ефективність моделей на різних 
етапах навчання. Він також демонструє, як 
моделі адаптуються до даних протягом 
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часу та ЯК їхня точність змінюється з 
кожною епохою. 


Таблиця 1. Точність для тренувального та тестового набору даних 


Тгаїіпяє, Ассигасу | Мапаайоп Ассигасу | ЕІ Зсоге 
Моасеі 1 0.998658 0.751342 0.767516 
Модеі 2 1 0.735242 0.749196 
Мод! 3 1 0.762075 0.770416 
Модеі 4 0.969128 0.754919 0.785933 
Мод! 5 1 0.73703 0.722853 
Модсе! 6 0.963311 0.783542 0.795597 
Моє! 7 1 0.744186 0.735849 
Мод! 8 0.740492 0.742397 0.773936 
Модеі 9 0.94094 0.758497 0.784431 

Яаїпіпд Ассигасу Уаїдакіоп Ассигасу 


Рис. 5. Точність для тренувального та тестового набору даних 


З даних графіків і таблиці можна 
зробити такий висновок: 

Моделі 4, 6, 8, 9 показали найкращий 
баланс, та не досягали перенавчання. А це 
тому, що 4, 6 і 9 використовували 
регуляризацію (ПДгороці). 

Модель 8 використовувала аугмента- 
цію даних, що призвело до того, що 
точність під час тренування була дуже 
близькою до точності під час валідації. 

Модель 6, що дала найкращий 
результат під час перших епох, мала 
найгіршу точність валідації серед усіх 
моделей та повільно, але стабільно 
зростала. 

Модель 5 з нормалізацією пакетів 
найшвидше досягла перенавчання, а саме за 
5 епох, мала одну з найнижчих точностей 
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під час валідації та найгірший показник НІ. 
А після 25 епох точність валідації 
знизилася від 7090 до 609). 

Більша кількість нейронів в шарі 
Оеп5е в моделі 7 також призвела до 


швидкого перенавчання та поганих 
показників під час валідації. 

Висновки 

В ході виконання даної роботи було 
проведено дослідження та розробка 
моделей | машинного навчання для 
класифікації зображень, зокрема для 
виявлення зображень, згенерованих 


штучним інтелектом (ШІ). Першочерговою 
метою було визначення, чи модель 
правильно класифікує зображення як 
реальні або згенеровані. 
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Під час аналізу вхідних даних було 
з'ясовано, що згенеровані зображення в 
середньому є темніші та містять більше 
шуму в порівнянні | з | реальними 
зображеннями. Ця інформація | була 
корисною під час розробки моделей 
машинного навчання. 

Для обробки даних було використано 
стандартизацію розміру зображення та 
нормалізацію значень пікселів, що 
допомогли забезпечити оптимальні умови 
для навчання моделей. 

Було | розроблено | 9  - моделей 
нейронних мереж з різною архітектурою. 
Це дозволило провести порівняльний 
аналіз та визначити, які моделі найкраще 
справляються з поставленою задачею. 

При порівнянні | моделей було 
з'ясовано, що деякі з них показали ознаки 
перенавчання, оскільки вони досягли 10090 
точності на тренувальних даних при значно 
нижчій точності на тестових даних. Це 
свідчило про те, що ці моделі вивчили 
специфічні особливості тренувального 
набору даних замість загальних шаблонів, 
які можна застосувати до нових даних. 

Чотири з дев'яти моделей показали 
найкращий баланс між точністю навчання 
та | валідації. | Зокрема, модель з 
нормалізацією пакетів показала найвищу 
точність валідації та ЕТ -оцінку, що робить 
її найкращим кандидатом. 

Практичне застосування цієї роботи 
може охоплювати різні області. Вона може 
бути | використана | для виявлення 
згенерованих зображень в соціальних медіа 
або на веб-сайтах, що допоможе боротися з 
дезінформацією та соціальною інженерією. 
Також ця робота може бути корисна для 
розробників алгоритмів, дозволяючи їм 
оцінювати якість генерованих зображень, 
порівнювати різні алгоритми генерації 
зображень та визначати, які аспекти 
зображення | є найскладнішими для 
відтворення для ШІ. 

Проведене дослідження демонструє, 
яко можна використовувати | машинне 
навчання для вирішення конкретних задач, 
зокрема, для класифікації зображень. 
Результати показують, що згенеровані 
зображення непросто відрізнити, оскільки 
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точність різних параметрів не досягала 8090 
чи вище. 
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